package znyl.common.utils;

import java.io.IOException;
import java.io.InputStream;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

public class PDFUtil {
    //使用Apache PDFBox将PDF格式文件转换成纯文本

    public static String pdfToString(InputStream inputStream) {

        PDDocument document = null;
        try {
            // 根据返回的链接加载PDF文档PDDocument.toad()
            document = PDDocument.load(inputStream);
            // 创建一个PDFTextStripper实例来提取文本
            PDFTextStripper stripper = new PDFTextStripper();
            // // 从PDF文档中提取文本
            String text = stripper.getText(document);
            return text;
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            // 关闭PDF文档
            if (document != null) {
                try {
                    document.close();
                    inputStream.close();// 关闭输入流
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return null;
    }
}
